1. 硬い制約からソフトペナルティへ
標準的な問題を考えます:$f_0(x)$ を最小化し、$f_i(x) \le 0$ および $h_i(x) = 0$ を満たすものとします。ある「硬い」制約は指標関数と等価です:
$$I_-(u) = \begin{cases} 0 & u \leq 0 \\ \infty & u > 0 \end{cases}$$
ラグランジュ構成はこの無限のジャンプを線形ペナルティで置き換えます。目的関数に制約関数の重み付き和を加えます:
$$L(x, \lambda, \nu) = f_0(x) + \sum_{i=1}^m \lambda_i f_i(x) + \sum_{i=1}^p \nu_i h_i(x)$$
ここで、$\lambda_i$ は ラグランジュ乗数です。これは第 $i$ 番目の不等式の影響をスケーリングする「ソフト」ペナルティとして機能します。重要なことに、まだ凸性を仮定していません。この枠組みは普遍的です。
我々は ラグランジュ双対関数 $g(\lambda, \nu)$ を $x$ に関するラグランジュ関数の下限として定義します。重要な性質は 下限性質:任意の $\lambda \succeq 0$ に対して、$g(\lambda, \nu) \le p^*$ です。これにより、直接解くことが不可能な問題の最適値を評価できるようになります。
2. ケーススタディ:ハイブリッド車両制御
燃料消費とバッテリー寿命のバランスを取る車両を想像してください。制約は物理的なものであり、どの瞬間でも電力需要を満たさなければなりません。
- 電力バランス: $P_{\text{req}}(t) = p_{\text{eng}}(t) + p_{\text{mg}}(t) - p_{\text{br}}(t)$
- バッテリー動力学: $E(t+1) = E(t) - p_{\text{mg}}(t) - \eta |p_{\text{mg}}(t)|$
- 目的: 最小化 $F_{\text{total}} = \sum_{t=1}^{T} F(p_{\text{eng}}(t))$
ラグランジュ枠組みを適用することで、バッテリー容量の制約は シャドウプライスに変換されます。コントローラーは現在のエネルギーの「コスト」(乗数)と燃料コストの比較に基づいて、燃料を燃やすかバッテリーを使うかを決定します。